15/11/2023

Introduzione

L’obbiettivo di questa analisi è abbastanza intuitivo: esaminare la crescita 📈 globale dei social media e dei suoi corrispondenti utenti 👥 nel 2022. I social media che il dataset prende in considerazione sono rispettivamente YouTube, TikTok e Instagram.

Storia dei dati

Il dataset è stato individuato su Kaggle. Diversamente da come citato dall’autore, il dataset globale propone solo una frazione di dati nell’arco temporale previsto, per cui l’analisi si concentrerà più nello specifico per ogni piattaforma su quattro mesi 🗓️ del 2022: giugno, settembre, novembre e dicembre, oltre che su una panoramica generale del 2022 sempre distinta per le tre piattaforme.

Il dataset possedeva fin dall’inizio moltissime criticità 🤯, in primo luogo la presenza di features incompatibili tra dataset della stessa piattaforma. Nelle diverse fasi di produzione, poi, un’altra problematica riscontrata è stata la scoperta di valori errati o incoerenti. È stato fatto chiaramente un lavoro di formattazione dovuto dei dataset (trasformazioni M e K). Questa fase di refactoring si è protratta anche durante tutta la fase di messa a punto del markdown che ha rallentato le tempistiche di realizzazione creando non pochi disagi😡.

Panoramica delle piattaforme

ad es. 31.3% è la media delle views👓 basata sui 1000 utenti👥 (chiamati comunemente “influencer”) di TikTok che il dataset prende in analisi.

Per quanto riguarda Instagram, i dataset relativi a questa piattaforma non presentano le stesse features incontrate nelle altre piattaforme. Di conseguenza in questo caso verrà graficata solo una panoramica dei followers👥.

Coinvolgimento del pubblico: TikTok vs Youtube

Per YouTube verranno analizzati solo likes👍 & commenti🗨️ per limitazione del dataset.

Quanto sono attive le piattaforme?

Coinvolgimento del pubblico: Instagram

authentic.engagement o tasso di coinvolgimento (Engagement Rate) è una metrica che misura le interazioni👍🗨🔁 ottenute da un profilo👤 con i suoi post📄 in rapporto al numero di follower👥. Mentre engagement.average è la media mensile/annuale degli ER per quell’influencer👤.

Dalla definizione di engagement, conoscendo i followers👥 possiamo ricavare con la formula inversa il numero di interazioni👍🗨🔁.

Andamento delle piattaforme nell’arco temporale

Instagram analysis

Paesi🌍 dove pubblicano contenuti i maggiori influencer👥

Categorie 1 e 2 più diffuse nei vari paesi🌍

Categorie più diffuse in Italia🇮🇹

Categoria più visitata per ciascun paese🌍

Andamento dei followers per piattaforma

Quali delle tre piattaforme considerate hanno piu’ followers👥?

Andamento degli followers per i maggiori influencers nell’arco temporale

Andamento delle interazioni per i maggiori influencers nell’arco temporale

Non considereremo instagram_jun perchè il dataset purtroppo risultava fin in origine corrotto.

Considerazioni conclusive e ipotetici studi che si possono approfondire

Vista e considerata la difficoltà nel lavorare e produrre delle analisi fondate sul dataset, proporrei innanzitutto una ridefinizione del dataset, principalmente per la presenza di valori discordanti o errati, poca chiarezza nella lettura e comprensione dei dataset e nessun riferimento da parte dell’autore.